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VECTEURS DE CLONAGE POUR RECOMBINAISON HOMOLOGUE ET 

PROCEDE LES UTILISANT 

La presente invention se rapporte a de nouveaux vecteurs utilisables.a la fois 
5 pour creer des banques d'ADN genomiques et en tant que vecteurs pour la 
realisation de reactions de recombinaison homologue dans des cellules hotes, 
permettant notamment d'ameliorer la selection desdits evenements de 
recombinaison homologue et de diminuer le temps d'obtention du vecteur final pour 
effectuer la reaction de recombinaison homologue. L'invention a egalement pour 

10 objet un procede mettant en ceuvre ces vecteurs. Ces nouveaux vecteurs et le 
procede les utilisant sont specialement adaptes pour la recombinaison homologue 
dans des cellules souches de mammiferes. 

L'obtention de souris porteuses de modifications genetiques programmees 
par 1'experimentateur a entierement modifie 1'etude de quasiment tous les aspects 

15 de la biologie de cet animal et de ces differents systemes (immunitaire, nerveux, 
hematopoietique, etc.). En outre, ces methodes de modification du patrimoine 
genetique de la souris permettent la creation de modeles murins de maladies 
genetiques humaines qui sont precieux pour Tetude de leur physiopathologie et 
eventuellement la mise au point de therapeutiques appropriees. Cela a ete rendu 

20 possible grace a la rencontre heureuse de deux approches tres differentes : Tune a 
abouti a Fisolement in vitro de cellules souches embryonnaires (cellules ES) et 
F autre apermis d'identifier, chez les cellules d'eucaryotes superieurs, les conditions 
necessaires au processus de recombinaison homologue entre un ADN exogene 
connu et la sequence homologue dans le chromosome. 

25 

La recombinaison homologue dans les cellules ES : creation de mutations nulles 
(souris knock-ouf) 

Des etudes effectuees dans les annees 1980 (Smithies et Capecchi par 
exemple) oiit demontre que les cellules embryonnaires souches (ES) possedent 
30 Pappareil enzymatique necessaire a la recombinaison homologue (RH) entre une 
sequence d'ADN exogene et la sequence homologue presente dans le genome de la 
souris, meme s'il s'agit d'un evenement rare comparativement a l'integration 
aleatoire de ce meme fragment d'ADN (Smithies et al., 1985 ; Wong and Capecchi, 
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1986). En depit de cette rare frequence d 5 apparition, la technique de recombinaison 
homologue a pu etre etendu a P etude de nombreux genes (Jackson laboratory) grace 
a differentes astuces de selection et de criblage. 

c 

5 Le Knock-in : Pautre aspect de la recombinaison homologue. 

Une variante interessante des vecteurs de ciblage pour Fobtention de 
mutations nulles resulte de P introduction, en phase avec la sequence codante du 
gene cible, d'un ADNc d'interet. 

Apres la recombinaison homologue, FADNc insere dans le gene cible est 
10 exprime sous le controle du promoteur endogene. Le choix de FADNc depend du 
projet et du but recherche. Par exemple, il peut s'agir de la sequence codante d'un 
gene rapporteur comme la p-galactosidase. L'expression de cette proteine mime 
alors F expression du gene cible, ce qui permet de determiner son profil 
d' expression (Li et al., 1997) et/ou de suivre le devenir des cellules exprimant le 
15 gene cible (Schneider-Maunoury et al., 1 993 ; Tajbakhsh et al., 1 996). 

Des mutations nulles aux mutations subtiles 

Si les mutations nulles (knock-out) representent un instrument d'analyse 
genetique tres puissant, il est clair que d'autres types de mutations plus fines 

20 (mutations ponctuelles, petites deletions ou insertions) sont tres utiles pour affiner 
les modeles d'etudes. Lorsque des alleles mutes sont crees, il est particulierement 
necessaire d'eliminer les sequences de selection qui pourraient interferer avec la 
regulation de Fexpression du gene cible ou de genes adjacents (Fiering et aL, 1999). 
Plusieurs strategies peuvent etres utilises pour creer des mutations "propres " 

25 (Moore et al., 1998 ; Cohen-Tannoudji et Babinet, 1998) comme le "Plug and 
socket " (Detloff et al., 1994), le " hit and run " (Hasty et al., 1991) ou le systeme de 
recombinases Cre/loxP ou FLP/FRT(Kilby et al., 1993). 

La strategie des recombinases (Cre/loxP, FRT/FLP...) repose sur 
Futilisation d'une proteine, la recombinase, et de sequences cibles. Dans le systeme 

30 Cre/loxP, la proteine Cre est une recombinase, identifiee chez le bacteriophage PI, 
qui agit lorsqu'elle reconnait dans un segment d'ADN, une sequence de 34 pb 
appelee loxP (Sauer and Henderson, 1988). Apres Fexcision par la Cre du fragment 
se trouvant entre les deux sequences loxP, Fallele mute porte un site loxP. Aucune 
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indication d'une interference de ce site avec P expression genetique n'a pu etre mis 
en evidence. 

La mutagenese conditionnelle 
5 La strategie Cre/loxP (ou FRT/FLP, qui est similaire) permet P apparition 

conditionnelle d'une mutation chez P animal en cours de developpement ou chez 
Fadulte (Cohen-Tannoudji et Babinet, 1998 ; Gu et al., 1994). II s'agit dans un 
premier temps de cr6er des souris porteuses d'un allele flanqu6 de deux sequences 
loxP encadrant une partie essentielle d'un gene d'interet sans pour autant alterer son 

10 fonctionnement, en les pla?ant par exemple dans des introns (gene " floxe "). On 
accouple une souris ainsi produite avec une autre souris transgenique exprimant la 
recombinase dans un type cellulaire particulier. Cette strategie est potentiellement 
tres efficace, car elle permet non seulement de contourner le probleme de la letalite 
embryonnaire qui se produit lorsque toutes les cellules de Pembryon portent la 

15 mutation, mais aussi d' examiner Peffet de cette mutation dans n'importe quel tissu 
pourvu que Ton dispose d'une lignee de souris transgeniques exprimant la proteine 
Cre dans le tissu en question (Xu et al., 1999 ; Shibata et al., 1997 ; Kulkarni et al., 
1999 ; Tsien et al., 1996 ; Harada et al., 1999). 

Un raffinement supplementaire consiste a controler Pinduction de la 

20 mutation, non seulement dans l'espace mais egalement dans le temps grace a des 
systemes inductibles. Dans cette optique, la proteine Cre est exprimee sous la forme 
d'une proteine de fusion avec un domaine de fixation a un ligand. Cette proteine de 
fusion ne presente pas d'activite Cre. En revanche, en presence du ligand approprie, 
un changement de conformation permet la restauration de Pactivite de Cre. Ainsi 

25 chez les souris transgeniques portant les deux alleles du gene d'interet " floxes "et 
exprimant la proteine Cre fusion (recepteur au ligand associe a la proteine) dans un 
tissu particulier (Shibata et al., 1997), P administration du ligand approprie 
provoquera Pinduction de la mutation nulle dans ce type de tissu au moment voulu. 
II est egalement possible de contrdler P expression de la recombinase en utilisant des 

30 systemes qui permettent d'induire ou de reprimer la transcription d'un gene 
rapporteur. Le systeme le plus documente utilise les proprietes du couple 
operateur/represseur de Poperon bacterien tetracycline (tet) (Baron U. et al, 1999) 
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Toutes ces techniques prometteuses presentent cependant deux 
inconv&iients majeurs, la construction de vecteurs complexes et le temps 
indispensable pour realiser et analyser ces modeles murins. 

Ainsi, on estime qu'aujourd'hui, le temps d'obtention d'une souris knock-in 
5 ou knock-out conditionnel est d'environ 15 a 18 mois. En moyenne, il faut en effet 
environ 8 a 9 mois pour doner, cartographies et construire le vecteur cible, 1 a 2 
mois pour la culture de cellules ES et enfin 6 a 8 mois d'animalerie et de 
croisement. 

L'objet de la presente invention est de reduire les delais de manipulations de 
10 biologie moleculaire qui devraient, par Futilisation des vecteurs et/ou procedes 
selon T invention, pouvoir etre menees en 3 mois au lieu de 8 ou9 mois. 

Ce gain de temps est significatif tout en presentant un risque plus faible de 
non-reussite grace a 1' elimination des etapes de sous-clonages et a la diminution du 
nombre d'etapes de clonage, grace a I'utilisation des vecteurs selon l'invention. n 
1 5 est estime que Futilisation de ces vecteurs permet de descendre en dessous de la 
barre des 12 mois pour produire un modele murin. 

L'objectif de la presente invention est de fournir un nouveau vecteur de 
base, adapte a la creation d'une banque d'ADN genomique, ledit vecteur etant 
egalement adapte pour pouvoir etre transforme de fa9on directe (sans sous-clonage) 
20 afin d'effectuer les reactions de recombinaison homologue dans Thote cible. 
L'invention divulgue ainsi un procede permettant d'accelerer la fabrication des 
vecteurs utilises pour la mise en ceuvre de la recombinaison homologue, dans tout 
organisme, et de preference dans des cellules eucaryotes, notamment des cellules 
souches ES issues d'organismes pluricellulaires. 

25 

Ainsi, dans un premier aspect, la presente invention a pour objet un vecteur 
de clonage adapte pour la creation d'une banque d'ADN genomique, caracterise en 
ce qu'il presente une cassette comprenant : 

- un polylinker permettant Pintegration d'un fragment d 5 ADN genomique, 
30 ledit polylinker etant flanque de sites rares de restriction, 

et que ladite cassette est flanquee de sites tres rares de restrictions. 

Un element est « flanque de sites de restriction » lorsqu'un site de restriction 
au moins est present a chaque extremite de T element. 
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Dans un mode de realisation preferee, ladite cassette comprend egalement 
au moins un gene de selection negative. 

Le vecteur selon Pinvention est parfaitement adapt6 pour la creation de 
banque d'ADN genomique, et permet notamment le clonage de fragments d'ADN 
5 de taille moyenne voire de grande taille. L'homme du metier sait ce que signifie 
qu'un vecteur est adapte a la creation d'une banque d'ADN, notamment genomique, 
c'est-a-dire qu'il permet d'inserer et d'obtenir la stabilite des sequences d'ADN 
inserees, notamment pour ce qui est du maintien du vecteur dans la cellule hote, en 
particulier lors de la replication, et pour lequel on observe un taux faible 
1 0 d'evenements de recombinaison du fragment d'ADN avec lui-meme et/ou perte de 
sequences d'ADN exogene. Des exemples de vecteurs utilisables sont donnes ci- 
apres. 

Par « fragments de taille moyenne », on entend notamment des fragments 
d'une taille superieure k 15 kilobases (kb), de preference comprise entre 1 5 kb et 75 

15 kb, de preference comprise entre environ 17 kb et environ 50 kb, de preference 
comprise entre environ 20 kb et environ 30-35 kb. 

Par « sites rares de restriction », on entend des sites de restriction dont la 
frequence de coupure est superieure a 10 kb, de preference 15 kb, de fa9on plus 
preferee 20 kb dans le genome humain. Paimi les enzymes rares, on peut 

20 notamment citer Pmel, SgrAl, RsrU 9 CM, NotU Pad, Srfi, Nhel, Fsel, NsiL 

Un site de restriction est dit « tres rare » lorsque sa frequence de coupure 
dans le genome humain est superieure a 100, de preference 200 kb (par exemple 
AscT). Parmi les sites de restriction tres rares utilisables, on peut citer les « Homing 
endonucleases ». Ces enzymes sont des proteines codees par des genes possedant 

25 des introns s'auto-epissant. Ces enzymes effectuent des coupures site-specifiques 
dans de 1'ADN double brin, et reconnaissent generalement des sites de 18-20 bases 
ou plus. On note en particulier I-Ppol, , I-Ceul 9 PI-PsI, I-Scel, Pl-Scel. 

Par ailleurs, ainsi qu'il sera vu, le vecteur de clonage selon la presente 
invention, et en particulier lorsqu'il presente au moins un gene de selection 

30 negative, est egalement particulierement adapte pour la recombinaison homologue 
dans des cellules de mammiferes, notamment les cellules souches murines, de lapin, 
porcines, bovines, humaines. 
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Dans un cas particulier, le vecteur selon 1' invention presente, dans son 
polylinker pour le clonage de PADN exogene, un maximum de 4, de preference 3, 
de preference deux sites de restrictions. II est particulierement avantageux de 
reduire le nombre de sites de restrictions situes dans le polylinker utilise pour 
5 P insertion du fragment d'ADN exogene, ou situes dans le squelette du vecteur, afin 
de pouvoir utiliser les enzymes de restriction correspondantes apres clonage du 
fragment d'ADN exogene, pour verifier notamment la nature dudit fragment, voire 
son orientation, ainsi que la nature, Porientation et Pemplacement exact des 
modifications introduces dans le fragment d'ADN exogene. Ainsi, il est possible 

1 0 que le polylinker ne presente qu'un seul site de restriction. 

II existe aujourd'hui differents types de vecteurs permettant la construction 
de banques d'ADN. On peut notamment citer les cosmides ou les chromosomes 
artificiels. Ces derniers, qui peuvent etre adaptes aux bacteries (BAC), aux levures 
(YAC) ou aux cellules mammiferes (MAC) permettent P integration stable de 

15 fragments d'ADN pouvant aller jusqu'a 200 kb ou plus. Les cosmides ont une 
capacite plus limitee (environ 20 a 40 kb), mais qui est toutefois plus importante 
que les plasmides classiques, par exemple ceux derives de pBlueScript qui ne 
peuvent recevoir au maximum qu' environ 14-15 kb. 

Les chromosomes artificiels de bacteries sont des vecteurs particulierement 

20 attractifs, car ils peuvent etre utilises dans des hotes faciles a manipuler (notamment 
Escherichia coli), et assurent un maintien stable des fragments d'ADN introduits. 

Ainsi, dans un cas particulier de Pinvention, le vecteur est derive d'un 
cosmide, ou d'un vecteur de chromosome artificiel, de preference de bacterie. 

Par « vecteur derive d'un autre vecteur », on entend que le vecteur final 

25 possede globalement le meme squelette (notamment les origines de replication...) 
que le vecteur de depart dont il est derive (vecteur parent). II est important de noter 
que ceci signifie egalement que, de preference, les elements intergeniques sont 
conserves. Les modifications apportees dans le vecteur de base sont de telles sortes 
que Phote de replication du vecteur reste le meme, et ne modifient pas les proprietes 

30 fondamentales du vecteur (nombre de copies, taille de P insert, stabilite...). II est a 
noter que Pon peut envisager de modifier le gene de selection du vecteur derive par 
rapport au vecteur parent, pour autant que les proprietes de reception d'ADN 
exogene du vecteur derive ne soient pas alterees par rapport au vecteur parent. 
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On choisit de preference un vecteur derive du corps du vecteur de 
chromosome artificiel de bacterie pBeloBACl 1, bien connu de Thomme du metier, 
dont la sequence peut notamment etre obtenue dans GenBank sous le numero 
d'accession U51113. 

5 Le vecteur selon Tinvention est preferentiellement base sur le squelette de 

pBeloBACl 1, digere par Sail, et religue. Ainsi, le vecteur selon Tinvention est 
depourvu des sequences cosN, loxP, et lacZ, initialement presentes dans 
pBeloBACll. Une telle modification permet en effet de supprimer certaines 
sequences d'origine bacterienne (lacZ), ou utiles dans la levure (cosN), ou pouvant 

10 interferer ulterieurement avec une recombinase utile pour le precede selon 
Tinvention (loxP). La suppression des elements d'origine bacterienne ou de levure 
est en effet avantageuse pour am61iorer la frequence des evenements de 
recombinaison dans les cellules de mammiferes. Le maintien du site loxP pounfcit 
s'averer genant pour Tutilisation ulterieure d'une recombinase Cre sur les vecteurs 

1 5 obtenus. 

Dans un cas particulier de l'invention, on a supprime, dans le vecteur selon 
Tinvention, au moins un site de restriction choisi parmi les sites presents 1, 2 ou 3 
fois dans le squelette du vecteur parent. 

L'absence d'au moins un des sites de restrictions precites dans le squelette 
20 du vecteur selon Tinvention permet notamment d'utiliser ce site pour Tetude des 
fragments integres dans ledit vecteur, ou pour introduire par precede enzymatique 
les genes de selection modifiant le fragment d'ADN exogene avant son utilisation 
pour la recombinaison homologue proprement dite. 

La modification du squelette du vecteur pour supprimer les sites precites 
25 peut etre effectuee par mutagenese dirigee, afin que Tenzyme de restriction 
correspondante ne coupe plus le squelette du vecteur. 

D'une fa9on preferee, et notamment lorsque le vecteur selon Tinvention est 
derive du vecteur pBeloBACl 1, on a supprime, dans son squelette au moins un site 
de restriction choisi parmi Apal, BstEll, SacII, Sfil, Spel, Sphl, StuL Xhol, BssHll, 
30 EcoKL, EcoKV, Kpnl, Ndel, Notl, Nrul, Pvwl, SgrAl, Xbal, PstI, Sail et Smal. Ainsi 
que precise plus haut, il peut etre avantageux de supprimer le maximum de ces sites 
de restriction, c'est-a-dire au minimum 2 de ces sites, au mieux 3 9 4 ou 5, dans le 
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meilleur des cas, de n'en garder aucun. Dans un cas particulier, le squelette du 
vecteur selon T invention ne possede plus le site BstElL 

Dans un mode de realisation particulier, la cassette du vecteur selon 
Pinvention presente un site tres rare de restriction a Tune de ses extremites et deux 
5 sites tres rares de restriction a Pautre extremite, Pun de ces deux sites etant de 
preference identique au site situe a la premiere extremite de la cassette. 

La presence de ces sites permet soit de lineariser le vecteur selon Pinvention 
(utilisation du site present a une seule extremite de la cassette), soit d'exciser 
Pinsert integre dans le vecteur (utilisation du site situe aux deux extremites de la 
10 cassette), 

Dans un cas particulier et prefere, le polylinker du vecteur selon Pinvention 
permettant Pintegration de PADN exogene est flanque de plusieurs (notamment un 
nombre egal ou superieur a 2, 3, ou 4) sites rares de restrictions choisis notamment 
parmi Pmel, SgrAl, RsrIL, C/al, Noil, Pad, Srfi, Nhel, FseL 

15 Le vecteur selon Pinvention contient ainsi au moins un gene de selection 

negative. On peut notamment choisir des genes suicides, c'est-a-dire qui codent 
pour des produits capables de transformer une substance inactive en substance 
cytotoxique. On cite notamment les genes de la thymidine kinase du virus HSV-1, 
utilisable avec le ganciclovir ou Pacyclovir, le gene DTA, codant pour le fragment 

20 A de la toxine diphterique, decrit dans Yagi et ah, (1990, PNAS, 87, 9918-22), 
toxique par sa seule presence. II existe aujourd'hui plusieurs genes suicides a la 
disposition de Phomme du metier, pouvant etre utilises comme marqueurs de 
selection negative. On peut aussi citer le cytochrome p450 de rat et la 
cyclophosphophamide (Wei et al., 1994, Human Gene Ther. 5, 969-978), la purine 

25 nucleoside phosphorylase & Escherichia coli (E. coli) et la 6-methylpurine 
deoxyribonucleoside (Sorscher et al., 1994, Gene Therapy 1, 223-8), la guanine 
phosphoribosyl transferase d'E. coli et la 6-thioxanthine (Mzoz et al., 1993, Human 
Gene Ther. 4, 589-595), les cytosine deaminase (CDase) ou uracil phosphoribosyl 
transferase (UPRTase) qui peuvent etre utilisees avec la 5-fluorocytosine (5-FC). 

30 Le gene de selection negative est ainsi situe a une extremite du polylinker 

utilise pour le clonage du fragment d'ADN genomique, mais le vecteur selon 
Pinvention contient de preference deux genes de selection negative (eventuellement 
identiques), chacun etant situe de part et d' autre dudit polylinker. 
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D'une fa9on preferee, le vecteur de clonage selon Finvention contient deux 
copies du meme gene de selection negative, flanquant le polylinker utilise pour le 
clonage du fragment d'ADN genomique, lui-meme flanque de sites rares de 
restriction (figure 1). 
5 On obtient done une construction ainsi faite (de 5' vers 3') : 

- au moins un site tres rare de restriction, 

- un marqueur de selection negative, 

- une cassette SRI possedant au moins un (de preference plusieurs) site(s) 
rare(s) de restriction, 

10 le polylinker presentant un nombre reduit de sites de restriction, 

une cassette SR2 contenant au moins un (de preference plusieurs) site(s) 
rare(s) de restriction, de preference different(s) du (des) site(s) de la 
premiere cassette, 

un marqueur de selection negative, eventuellement identique au premier 
1 5 marqueur, 

au moins un site tres rare de restriction, de preference deux sites tres 
rares de restriction, Tun etant de preference identique au premier site 
mentionne ci-dessus, P autre different. 
La presence de plusieurs sites tres rares de restriction permet en effet de 
20 lineariser le vecteur de clonage selon Finvention ou d'isoler F insert situe entre deux 
sites tres rares de restriction. 

II est a noter que, de preference, les sites rares de restriction contenus dans 
une des cassettes sont tous differents de ceux contenus dans F autre cassette. Ceci 
permet en effet de lineariser le vecteur selon Finvention apres clonage du fragment 
25 d'ADN genomique, et, dans la mesure ou il est interessant, pour des evenements de 
recombinaison homologue dans les cellules mammiferes, de disposer d'un bras long 
d'homologie et d'un bras court d'homologie, de pouvoir utiliser Fexonuclease III 
afin de reduire Fun des deux bras. II est a noter que les cassettes SRI et SR2 
peuvent aussi contenir des sites de restriction moins rares, tels notamment Sad, 
30 Swal,SphlouSaR. 

Le vecteur selon Finvention permet done la construction d'une banque 
d'ADN genomique de Porganisme dans lequel on desire effectuer la recombinaison 
homologue. De preference, cette banque est composee de fragments de taille 
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rnoyenne, afin de pouvoir effectuer les modifications necessaires a la recombinaison 
homologue directement dans le vecteur ayant servi a la construction de la banque, 
sans qu'il soit necessaire de sous-cloner le fragment d'ADN genomique portant le 
locus cible, apres son identification dans la banque. II est toutefois important de 
5 noter que la taille des fragments dans la banque peut etre proportionnelle a la taille 
du genome de 1'organisme cible, dans la mesure ou il est interessant (notamment 
pour des raisons pratiques de manipulation) de limiter le nombre de clones presents 
dans la banque. Ainsi, pour un genome tel que celui de la souris, on choisit de 
fabriquer une banque de fragments d'une taille moyenne egale a 20-30 kb. 

10 Dans un mode de realisation prefere, le vecteur selon l'invention est le 

vecteur represents par SEQ ID N° 1, possedant en outre les caracteristiques 
suivantes: 13478 pb, circulaire, nt 4629..5S97 proteine SOPB, nt 3454..4626 
proteine SOP A, nt 2120..2872 proteine REP, nt 999..1343 proteine Resolvase, nt 
114..780 gene de resistance au Chloramphenicol, nt 6443..9851 gene DTA, nt 

15 10037..13451 gene DTA, nt 9943^.9962 oligonucleotide Sp6, nt 9902..9922 
oligonucleotide T7. 

La presente invention concerne done egalement une banque d'ADN 
genomique de fragments de taille moyenne, fabriquee dans un vecteur selon 
l'invention. L'homme du metier connait les differents moyens de fabriquer une 
20 banque d'ADN genomique dans un vecteur approprie, notamment par digestion 
partielle de 1'ADN genomique. 

Le vecteur selon l'invention a de plus ete optimise afin qu'il soit 
parfaitement adapte a xm procede de mise en oeuvre de recombinaison ciblee dans le 
genome d'un organisme cible, apartir d'une banque de fragments genomiques qui y 
25 sont clones. 

Ainsi, on peut introduire les elements modifiant le fragment portant le locus 
cible identifie dans la banque d'ADN genomique directement dans le vecteur le 
portant et effectuer la reaction de recombinaison homologue dans I'hdte cible, sans 
avoir besoin de sous-cloner le locus cible. 
30 En effet, le fait que le vecteur selon l'invention porte un gene de selection 

negative permet de selectionner plus facilement les evenements de recombinaison 
homologue. 
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Apres selection du clone portant le locus cible dans la banque d'ADN 
genomique, on peut introduire le ou les fragments d'ADN qui seront utilises pour 
modifier le gene cible in vivo (par exemple les genes de selection positive ou sites 
de reconnaissance de la recombinase Cre). Ces fragments d'ADN peuvent etre 
5 introduits dans le vecteur par clonage ciassique (utilisation de sites enzymatiques) 
ou par recombinaison homologue dans les bacteries, ou encore par 1'utilisation de 
transposons ou par toute autre technique adaptee. L'utilisation de transposons est 
preferee, car elle permet de reduire le temps necessaire a l'obtention du locus 
modifie, puisqu'il n'est pas besoin d'etudier prealablement la cartographie dudit 
10 locus. 

Ainsi, la presente invention a egalement pour objet un precede pour 
effectuer une recombinaison ciblee dans un organisme, a partir d'une banque 
d'ADN genomique dans un vecteur selon P invention comprenant : 

a) Tincubation d'un vecteur de ladite banque genomique avec au moins un 
15 fragment d'ADN comprenant au moins un transposon, ledit transposon 

comprenant 

un gene de selection positive, 

- eventuellement un gene de selection negative et/ou un gene 
marqueur, 

20 lesdits genes de selection etant eventuellement encadres par les sites 

d'action I d'une recombinase site-specifique I, et de fapon optionnelle 

- au moins un site d'action II d'une recombinase site-specifique II 
differente de la premiere recombinase I, 

ledit site d'action II n' etant pas situe entre lesdits sites d'action I de la 
25 premiere recombinase I, 

en presence d'une enzyme ayant une activite de transposase pour 
le(s)dit(s) transposon(s), de telle sorte que le(s)dit(s) transposon(s) est 
(sont) transfer£(s) dans ledit fragment genomique, 

b) 1' introduction dudit vecteur, eventuellement linearise, portant ledit 
30 fragment genomique dans lequel est (sont) insere(s) le(s)dit(s) 

transposons dans une cellule hote cible issue dudit organisme, 

c) la selection des tenements de recombinaison homologue dans ladite 
cellule cible par 1'utilisation du (des) gene(s) de selection positive 



WO 02/097100 




PCT/FR02/01782 



porte(s) par le(s)dit(s) transposon(s), et eventuellement du gene de 
selection negative porte par iedit vecteur de clonage. 
De preference, ledit fragment genomique modifie est un fragment de taille 
moyenne. 

5 Le precede selon T invention pennet T integration ciblee, et la recombinaison 

homologue dans un organisme cible, de preference un organisme mammifere, de 
fa9on plus preferee des cellules de rongeurs (notamment murines), de lapins, 
porcines, ovines, bovines, voire humaines. 

Afin de verifier les loci d'integration des transposons dans les fragments 
1 0 genomiques portes par les vecteurs selon T invention, on peut notamment utiliser les 
enzymes de restriction coupant aux sites rares dans les cassettes SRI et SR2. On 
utilise aussi eventuellement ces enzymes pour lineariser le vecteur, et former les 
petit et long bras d'homologie grace a Taction ciblee de Pexonuclease III. 

Le precede selon T invention est avantageusement complete en faisant suivre 
1 5 Tetape c) d'une etape d) : 

d) la soumission des cellules transformees par recombinaison homologue et 
selectionnees dans Tetape c) a Taction de la recombinase I, afin 
d'eliminer le(s) gene(s) de selection positive et eventuellement negative 
porte(s) par le(s) transposon(s). 
20 De fa9on preferee, T organisme cible est done un organisme pluricellulaire, 

et ladite cellule cible issue dudit organisme est une cellule souche. 

Dans un cas prefere, on induit la deletion d'un fragment genomique et/ou 
Tinsertion d'un fragment exogene dans ledit organisme apres T etape c) ou 
eventuellement Tetape d) par la mise en contact des cellules selectionnees dans 
25 Tetape c) ou derivees desdites cellules avec la recombinase II. Ceci permet ainsi 
d'obtenir une inactivation conditionnelle du gene que Ton a cible, notamment 
lorsque la construction a ete realisee de telle fa9on que les sites loxP se retrouvent 
dans des introns du gene que Ton desire inactiver. Cette inactivation conditionnelle 
est effectuee in vivo, ainsi que decrit dans T introduction. 
30 La presente invention conceme egalement un kit comprenant : 

- un vecteur de clonage selon Tinvention, 

au moins un fragment d'ADN comprenant au moins un transposon, ledit 
transposon comprenant un gene de selection positive, et eventuellement 
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un gene de selection negative et/ou un gene marqueur, le(s)dit(s) gene(s) 
de selection etant eventuellement, et de fa9on preferee, encadre(s) par les 
sites d'action I d'une recombinase site-specifique I. 
De fa9on optionnelle, ledit transposon comprend egalement un gene de 
5 selection negative ou un gene marqueur situe a cote du gene de selection positive, 
situe ou non entre les sites d'action I de ladite recombinase site-specifique I lorsque 
celle-ci est presente. 

Le transposon utilisabie pour la presente invention peut etre de toute sorte, 
notamment le transposon Tn5. Le transposon Tn5 est choisi de preference pour son 
10 integration unidirectionnelle dans l'ADN cible (de 5' vers 3'), pour une utilisation 
directe avec une transposase sans avoir a raj outer de cofacteurs et pour sa 
commercialisation en kit. 

Pour contourner le probleme d'instabilite, s'il se presente, 1'utilisation de 
differents types de transposons (par exemple Tn5, TnlO, Tn7) peut etre envisagee 
15 (Brune et al., 1999; Chatterjee and Coren, 1997; Goryshin et al., 2000; Goryshin 
and Reznikoff, 1998; Stellwagen and Craig, 1997; Westphal and Leder, 1997; Yang 
etah, 1997). 

Certains genes de selection negative utilisables pour la mise en oeuvre de la 
presente invention ont ete cites plus haut Parmi les genes marqueurs utilisables, on 
20 peut citer le gene lacZ, ou les genes codant pour des proteines fluorescentes (FP). 

Les genes de selection positive sont bien connus de l'homme du metier et 
sont preferentiellement des genes de resistance a un antibiotique, tel les genes de 
resistance a la kanamycine, qui pennet egalement la resistance a la neomycine dans 
les cellules mammiferes, resistance a Thygromycine, a la zeocine, a la 
25 blasticidine.,. 

De fa£on optionnelle, le transposon comprend egalement au moins un site 
d'action II d'une recombinase site-specifique II differente de la premiere 
recombinase I, le(s)dit(s) site(s) d'action II n' etant pas situe(s) entre lesdits sites 
d'action I de la premiere recombinase I. 
30 De fa9on preferee, le kit selon l'invention comprend deux fragments 

d'ADN, chacun comprenant un transposon, chaque transposon portant un gene de 
selection positive different, et eventuellement un gene de selection negative, le gene 
de selection negative etant alors de preference identique pour les deux transposons, 
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lesdits genes de selection positive et negative etant de preference encadres par les 
sites d'action d'une recombinase I. 

Dans un mode de mise en oeuvre preferee de Pinvention, chaque transposon 
comprend une sequence correspondant a un site d'action d'nne recombinase II 
5 differente de la premiere recombinase I. 

Ainsi, dans un cas prefere, ladite recombinase I est la recombinase FLP, 
ladite recombinase II etant la recombinase Cre. II est alors avantageux que Tun des 
transposons contiennent les sequences FRT natives reconnues par la recombinase 
FLP, T autre transposon contenant alors les sequences FRT* mutees, telles que 
10 decrites par Schalke et Bode (1994). 

Afin de mettre en csuvre le procede selon F invention, decrit plus haut, pour 
faciliter les evenements de recombinaison ciblee, il est avantageux que le kit selon 
Finvention comprenne egalement une enzyme ayant une activite de transposase 
pour le(s)dit(s) transposon(s), ainsi que les instructions de mise en ceuvre pour 
15 Tinsertion du(des)dit(s) transposon(s) dans le fragment genomique situe dans Iedit 
vecteur de clonage. 

DESCRIPTION DES FIGURES 

Figure 1 : carte schematique d'un vecteur modifie selon Y invention. SRI et SR2 : 
20 cassettes presentant les sites de restriction rares. PL : polylinker pour le clonage des 
fragments genomiques. DTA : gene de la sous-unite A de la toxine diphterique. 
Figure 2 : description de Tinsertion de deux transposons dans un fragment d'ADN 
dans le vecteur selon Y invention. DTA: gene du fragment A de la toxine 
. diphterique, present dans le vecteur selon P invention. SRI et SR2, cassettes 
25 contenant au moins un site de restriction rare. Site tres rare : site notamment 
d'Homing endonuclease. Kana : gene de resistance a la kanamycine en bacteries, a 
la neomycine dans les cellules eucaryotes. Zeocin : gene de resistance a la zeocine. 
TK : gene de la thymidine kinase du HSV1. FRT : sites de reconnaissance de la 
recombinase FLP. FRT* : sites mutes de reconnaissance de la reombinase FLP. 
30 LoxP : sites de reconnaissance de la recombinase Cre. OE/S : sequences permettant 
de determiner le locus d' integration du transposon. 

Figure 3 : Schema de la recombinaison homologue d'un vecteur selon V invention 
apres integration de transposons dans un locus genomique. Les boites noires 1 3 2, 3 5 
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4 represented les exons du gene cible. Les autres sigles ont la signification 
precedents L'evenement de recombinaison homologue est selectionne par la 
resistance a la neomycine (presence du gene kanamycine) et a la Zeocine, et 
l'absence des genes DTA du vecteur (selection negative). 
5 Figure 4 : Action de la recombinase FLP dans les cellules selectionnees pour la 
recombinaison homologue pour obtenir un locus final knock-out conditionnel en 
supprimant les sequences d' ADN exogenes (genes de resistance). 
Figure 5 : Action de la recombinase Cre sur les cellules selectionnees pour la 
recombinaison homologue pour obtenir un locus final knock-out, et production 

10 d'une proteine tronquee. 

Figure 6 : Action de la recombinase Cre in vivo dans F animal transgenique derivant 
des cellules ayant ete soumises a la recombinase FLP pour obtenir un locus final 
knock-out, et production d'une proteine tronquee de maniere conditionnelle. 
Figure 7 : carte du plasmide pBeloBACll, utilise en taut que vecteur parent pour 

1 5 certains vecteurs selon F invention. 

Figure 8 : strategie de melange (« pooling ») des clones de la banque d'ADN 
genomique integres dans un vecteur selon Finvention. 8.A : melange des clones de 
24 plaques (« superpooling »). 8.B : definition de pools de lignes, colonnes et 
plaques individuelles. 8.C : plaque de PCR a partir d'un « superpool ». 8.D plaque 

20 pour PCR a partir des pools de lignes, colonnes et plaques. 

EXEMPLES 
Exemple 1 : 

La premiere etape consiste a creer une banque de mini -B AC (entre 20 et 30 
25 kb) adaptee a la construction de tous les types de vecteurs de recombinaison 
homologue. Cette banque est produite a partir d'ADN genomique de souris 129 sv 
et d'un vecteur pBeloBacl 1 modifie (figure 1). Des genes de selection negatifs sont 
rajoutes de part et d'autre du poly-linker de pBeloBAC. Les fragments d'ADN 
genomique dits grand bras et petit bras d'homologie du vecteur de recombinaison 
30 homologue (Thomas et Capecchi, 1987 ; Hasty et al., 1991 ; Thomas et al., 1992) 
proviennent de cette banque. 
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Des techniques standard de selection comme la PCR et le Southern blot sont 
utilisees pour selectionner le mini-BAC contenant la partie a modifier du gene 
d'etude. 

Des transposons sont inseres dans le mini-BAC afin d'introduire des genes 
5 de selection procaryotes, eucaryotes, et des sites d' action des recombinases. Ces 
transposons portent egalement des sequences specifiques pouvant servir aux 
sequen9ages, aux tests PCR et aux digestions enzymatiques (Figure 2). 

Le vecteur de recombinaison homologue est electropore dans des cellules 
ES, Fevenement de recombinaison homologue est selectionne en presence de 
1 0 Zeocine, de G41 8 (Yagi et al., 1 990) (Figure 3). 

L'obtention de la mutation dite propre dans ces cellules ES recombinees est 
obtenue par Taction de la recombinase FLP en presence de gancyclovir (Hasty and 
Bradley, 1993) (action d'elimination des cellules ES contenant le gene de la 
thymidine kinase TK). 

15 

Construction de la banque de BAG 

Le genome de la souris est forme d' environ 3 milliards de paires de bases. 
Pour couvrir de fa9on satisfaisant ce genome, il est essentiel d'avoir une bonne 
representation de sa diversite au sein de la banque de depart. Un modele statistique 
20 a ete elabore dans ce but. n se base sur 1' equation mathematique suivante: 

N = -L01n((l-p)/(L-I)) 

Cette equation prend en compte les elements suivants : 

- L : taille du fragment insere dans le mini-BAC 
25 N : nombre de clones composant la banque 

- p : pourcentage de reussite du criblage de la banque 

- 1 : taille du locus cible devant etre present dans le mini-BAC 

- L : Longueur minimum insecable d'interet 
L0 : longueur du genome 

30 

La taille du fragment genomique est choisie entre 20 et 30 kb (moyenne a 25 
kb). Cette taille permet une manipulation facilitee des BAC tout en n'augmentant 
pas trop le nombre de clones devant composer la banque de BAC. 
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La premiere etape consiste a selectionner le ou les mini-BACs positifs pour 
la region du gene d'interet (locus cible). Ce travail est realise par analyse de la 
totalite de la banque en associant des techniques simples de selection par PCR et par 
Southern blot. En moyenne, 150 PCR sont necessaires pour realiser ce travail (test 
5 des superpools puis des pools et enfin identification des clones positifs). 

Parmi les BAC detectes positifs, il convient de choisir celui qui contient le 
gene d'interet dans une position adequate. En effet, il est essentiel que les sites 
d'insertion vises pour Pintegration des transposons ne soit pas trop proche des 
extremites. Le petit bras d'homologie doit avoir une taille minimale d'environ 3,5 
1 0 Kb pour autoriser la construction du vecteur temoin positif et du vecteur final de 
recombinaison homologue. Ce choix se fait par simple profil enzymatique suivi 
d'une detection des fragments cibles. 

Integration des transposons 

15 Dans le mini-BAC choisi, deux transposons (Tn5) sont integres 

aleatoirement, porteur chacun de genes de resistances differents (Yang et al, 9 1997). 
Chacun possede des sequences specifiques permettant de remplir sa mission 
d'insertion (OE de deux fois 19 Pb). Les insertions et la caracterisation du site 
d'insertion de chaque transposon se fait successivement. 

20 Le transposon 1 correspond a la cassette exogene classique d'un vecteur de 

recombinaison homologue (Figure 2) contenant le gene de selection positive (Neo) 
et negatif (TK) encadre de sites d'action d'une recombinase ou non, de genes 
marqueurs (lacZ par exemple) ou non ... II est a note que ce gene de selection positif 
est egalement utilise comme gene de selection de 1' integration du transposon dans le 

25 mini-BAC (promoteur mixte eucaryote-procaryote). 

Pour Tinactivation classique d'un gene, le transposon 1 est introduit dans 
une region indispensable a l'expression du gene (exon 1 par exemple). Sinon il sera 
introduit dans un intron pour permettre une inactivation conditionnelle ulterieufe. 

Le transposon 2 apporte un deuxieme gene de selection negative (TK) et un 

30 gene de selection positive a la zeocine, encadre de sites d'action d'une recombinase. 
Ce transposon permet d'introduire une pression de selection sur l'integration d'un 
site loxP (additionne ou non d'autre sequence) utilise par la recombinase Cre. De 
nombreux problemes lors de l'evenement de recombinaison homologue ont ete 
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mentionnes pour les modeles animaux deactivation conditionnelle de gene. En 
effet, il n'est pas rare d 5 avoir une integration homologue de la partie se trouvant 
sous la pression de selection au G418 (neomycine) mais de perdre a chaque fois la 
sequence loxP (34 pb) presente en amont ou en aval. L' introduction du deuxieme 
5 gene de selection (zeocine) au niveau de cette sequence loxP augmente les chances 
d'obtenir des cellules ES ayant integre de fa9on homologue les deux transposons et 
done les deux sequences loxP d'interet. 

Les transposons sont con9us afin de pouvoir determiner leur position 
relative ainsi que leur position par rapport aux extremites de Tinsert du mini-BAC 
10 (site de restriction (SI, S2, S3, S4), sequences specifiques pour amorces de PCR 
(OE)»0. 

Selection de Fevenement de recombinaison homologue 

A ce stade, de nombreux antibiotiques sont utilises en association. 
15 U integration des deux sequences loxP se fait sous la pression de selection au G418 
et a la zeocine. La selection de Fevenement de recombinaison homologue est 
facilitee par la selection negative DTA au deux extr6mites de la construction. 

" Nettoyage " des cellules ES recombinees : obtention d'une mutation dite 
20 "propre" 

Pour produire un modele murin le plus proche possible de la realite, il est 
necessaire d'enlever les genes utilises pour les selections des evenements 
d'integration des transposons dans le mini-BAC et de l'evenement d'integration du 
transgene dans les cellules ES (Figure 4). Dans cette optique, il est interessant 
25 d'utiliser des sequences reconnues par la recombinase FLP, les sites FRT mutes ou 
non. 

Le principe est le suivant : deux sites FRT vont permettre a la FLP d'exciser 
les sequences se trouvant entre ces deux sites. II ne reste alors plus qu'un des deux 
sites FRT. Un site FRT mute ne peut agir qu'avec un autre site FRT mute (Schlake 
30 and Bode, 1994). De cette maniere, il nous est possible d'exciser les genes de 
selection de Finsertion des deux transposons. II ne reste alors plus que les sequences 
permettant Finsertion des transposons (OE% les deux sequences loxP et deux 
sequences FRTs (mutees ou non). Ces sequences (OE, loxP, FRT) se retrouvent sur 
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deux sites d'insertion et represented chacun 150pb (voir figure 4). Les cellules ES 
recombinees dites propres sont micro-injectees dans des blastocystes pour donner 
un modele murin. 

5 Exemple 2 : Creation du vecteur de clonage rTgV 
• Construction du vecteur rTgV 

1) Construction d'un derive de pBeloB AC1 1 ayant perdu le fragment compris entre 
les sites Sail 7030 et Sail 646 ainsi que ces sites Sail et contenant a la place du 
fragment compris entre les sites Sail 7030 et Sail 646 la sequence de clonage 

1 0 intermediate suivante (SEQ ID N° 2) : 

5 ' ctcgagtaactataacggtcctaaggtagcgaggcgcgccatcgatgtcgactcgctaccttaggaccgtt 
atagttactcgag-3' 

contenant les sites de restriction suivant : Xhol - I-Ceul — AscI -Clal - Sail- 
I-Ceul- Xhol. Les extrernites Xhol ont ete liguees avec les extrernites Sail du 
1 5 vecteur. 

Le plasmide resultant est appele pBeloB AC 13. 

2) Construction d'un derive de pBeloBAC13 ayant perdu le site BstEII. Le vecteur 
pBeloB AC 1 3 a ete digere par BstEII, traite a la Klenow et religue. 

20 Le plasmide resultant est appele pBeloB AC 1 3 BK- 1 . 

3) Construction d'un derive de pBeloBAC13 BK-1 contenant un site Swal dans la 
sequence de clonage intermediate. Le vecteur pBeloBAC13 BK-1 a ete digere par 
AscI et Sail et la sequence suivante a ete inseree entre ces deux sites : 

25 5 5 - ggcgcgccatttaaatctcgag - 3 ' 

Cette sequence contient les sites de restriction suivant : AscI — Swal - Xhol. 
L'extremite Xhol a ete liguee avec l'extremite Sail du vecteur et Pextremite AscI 
avec Pextremite AscI du vecteur. 

Le plasmide resultant est appele pBeloBAC13 BK-1 AS-1. 

30 

4) Construction d'un derive du vecteur DTArTgV contenant un site Smal a la place 
du site Sail en position 2 et un site Sail a la place du site BamHI en position 3049. 
Cette construction a ete effectuee en inserant des oligonucleotides double brin 
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contenant les sites Smal en position 2 et Sail en position 3409 du plasmide 
DTArTgV. 

Le plasmide resultant est appele DTA ASall ABamHI. 

5 5) Clonage au site Swal du vecteur pBeloBAC13 BK-1 AS-1 de deux copies du 
fragment de 3.4 kb contenant le gene DTA. 

Une copie du gene DTA provient provient du vecteur DTA rTgV digere par 
BamHI, traite a la Klenow, digere par Sail et purification du fragment d'interet de 
3.4 kb. 1/ autre copie du gene DTA provient du vecteur ATA ASall ABamHI digere 

10 par Smal, Sail et purification du fragment d'interet de 3.4 kb. A la suite de ce 
clonage, Tune des extremites Swal du plasmide pBeloBAC13 BK-1 AS-1 est liguee 
a Pextremite BamHI (Klenow) d'une copie du gene DTA et 1* autre extremite Swal 
est liguee a 1' extremite Smal de la seconde copie du gene DTA. Les deux copies du 
gene DTA sont liees par leur extremite Sail. 

15 Le plasmide resultant est appele pBeloBAC13 BK-1 AS-1 DTA-2. 



6) Preparation d'un plasmide derive de Bluescript KS(+) contenant la sequence 
suivante: 

5 5 - 

20 tcgagggccggccgagctcatgcattgcggccgcgtttaaacatttaaatgtaatacgactcactatagggcgaggatcc 
aagcttagtattctatagtgtcacctaaatcgtatgtcgaccggaccggcccgggcgcatgcttaattaatggcaaacagc 
tattatgggtattatgggtctcgag-3 5 

Cette sequence contient les sites de restriction suivant dans cet ordre : Xhol 
- Fsel - Sad - Nsil - NotI - Pmel - Swal - BamHI - Hindlll -Sail - RsrII - Srfl - 

25 SphI - Pad- PI-PspI - Xhol ainsi qu'une sequence dite T7 entre les sites de 
restriction Swal et BamHI et une sequence dite SP6 entre les sites de restriction 
Hindlll et SalL Cette sequence est designee par [polylinker] dans la suite de la 
description. 

Le plasmide resultant est appele BlueLC-2. 

30 

7) Clonage au site Sail du plasmide pBeloBAC13 BK-1 AS-1 DTA-2 du « 
polylinker » prepare par digestion du plasmide BlueLC-2 par Xhol et purification 
du fragment d'interet de 1 87 pb. 
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Le plasmide resultant est appele pBeloBAC13 BK-1 AS-1 DTA-2 LC-16. 

Exemple 3 : Creation de la banque de BAC utilisant le vecteur de clonage 
rTgV decrit dans P exemple 2. 

5 Cette banque est constitute de 300 000 clones representant 2,5 fois le 

genome murin. Elle a 6t6 realisee selon les procedures suivantes : 

• Souche bacteriennne et conditions de culture 

E. Coli DH10B (Grant et al. 1990) a ete utilisee comme hote des mini-BAC. 
10 Le vecteur de base (vecteur genOway decrit plus haut) a ete utilise pour construire 
cette banque. La culture des bacteries DH10B s'est effectue de maniere classique 
dans du LB a 37°C (Sambrook et al. 1989). Les clones recombinants ont ete 
selectionnes sur des boites d'agar contenant 12,5 \xg/ml de chloramphenicol apartir 
de E. Colis DH10B electrocompetentes non congelees (Sheng et al. 1995). 

15 

• Preparation d ? ADN genomique et construction de la banque 

L'ADN genomique a ete prepare a partir de culture de cellules souches 
embryonnaires (ES) de souris en fond genetique 129svJ selon le protocole standard 
decrit dans Sambrook et al. (Chapitre 9) et dans Vaiman et al. (1999). 
20 L'ADN genomique est digere partiellement avec Hindlll, les fragments de 

20-30 kb sont isoles par Pulse field et introduit dans le vecteur rTgV par ligation 
Hindm. 

La preparation du vecteur rTgV a et6 realisee selon le protocole de Woo et 
al.,1994. 

25 

Exemple 4 : Elaboration de la structure de la banque de BAC et de son mode 
de criblage 

Apres obtention des differents clones composant la banque de BAC, 
contenant PADN genomique, la banque est classee, afin de pouvoir etre rapidement 
30 criblee pour identifier le(s) clone(s) portant le locus d'interet auquel on desire 
effectuer P operation de recombinaison. 
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On repique done les colonies et Ton effectue differentes etapes de melanges 
entre les colonies (« pooling »), ce qui permet d'effectuer moins de reaction de 
criblageet de pouvoir malgre tout identifier les clones de fa9on univoque. 

5 • Repiquage des colonies 

Les colonies prealablement etalees sur plateau 22x22 cm2 sont repiquees par 
une station robotisee 'Qpix 1 de la marque Genetix puis deposees dans des plaques 96 
puits (marque TPP distributes par ATGC ref. T92697) contenant 200 ill de milieu 
2YT (Sigma ref. Y2377) - glycerol 10% final - chloramphenicol 12.5 ^ig/ml final 
. 10 (Sigma ref C0378) par puits (plaques MBAA 0001 a 3168 'A'). Ces plaques sont 
incubees toute la nuit a 3 7°C 

• Copies des plaques de la banque 

Deux copies de ces plaques sont realisees : 
15 - Une copie en plaque de 96 puits identique a la plaque mere 

Une copie en plaques de 96 puits de type « deep-well » (ATGC ref. 
219009) contenant 1 ml de milieu 2YT-chloramphenicol par puits. Cette plaque 
servira a la manipulation de pooling des clones. Ces plaques sont incubees toute la 
nuita37°C. 

20 

• Pooling des clones 

Les plaques « deep-well » sont groupees par 24. 

Le premier niveau de pooling est la realisation de « Superpools ». lis 
correspondent au melange de tous les clones d'un groupe de 24 plaques. Le nombre 
25 de superpools est donne par le nombre total de plaques de la banque divise par 24. 
Ce systeme permet de localiser rapidement un clone dans un groupe de 24 plaques 
en effectuant un nombre de points de PCR correspondant au nombre de superpools 
(figure 8 .A). 

Le deuxieme niveau de pooling est la realisation de 'pools'. Toujours par 
30 groupes de 24 plaques, les clones sont melanges par lignes (pools de ligne) par 
colonnes (pools de colonnes) et par plaques (pools de plaques), ainsi qu'indique sur 
la figure 8.B. Si un clone se trouve dans ce groupe, un des 24 pools de plaque doit 
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etre positif en PCR ainsi qu'un pool de ligne et de colonne. Le recoupement de ces 
trois informations donne l'adresse du clone dans la banque. 

Ces melanges sont realises a Taide d'une station robotisee f Biorobot3000 f de 
la marque Qiagen ou une station robotisee r Biomek2000 f de la marque Beckman. 
5 Ces stations sont des robots 'pipeteurs' fonctionnant a l'aide de cones steriles 
jetables. 

• Preparation des ADNs des pools 

Tous les melanges sont centrifuges, les culots bacteriens laves avec du Tris- 
10 EDTA (sigma ref. E5134) (TE) 3 recentrifuges puis resuspendus dans du TE. L'ADN 
des B ACs est ensuite recupere en faisant bouillir les melanges au micro-ondes. Puis 
les melanges sont centrifuges et on recupere les surnageants. 

• Distribution des ADNs en plaque 96 puits pour le criblage par PCR 

15 Les surnageants de tous les superpools sont distribues dans une ou plusieurs 

plaques de 96 puits deep-well afin de constituer un stock qui sera facilement 
manipulable a l'aide d'une pipette multicanaux (Figure 8.C). 

Pour un pool, les 24 surnageants des melanges de plaque, les 12 surnageants 
20 des melanges de colonnes et les 8 surnageants des melanges de ligne sont distribues 
dans une demi plaque de 96 puits deep-well (Figure 8.D). Dans chaque plaque on 
peut disposer deux pools. 

L'ADN de chaque puits peut etre ensuite dilue pour preparer des plaques 
25 utilisables en PCR. 

Exemple 5 : Realisation d'un vecteur de ciblage et recombinaison hotnologue 
en cellule ES 

• Verification de la stabilite des mini-BAC de la banque 
30 Un echantillon representatif de 40 clones a ete cultive et analyse de maniere 

a verifier la stabilite des mini-BAC. Aucune instabilite ou diminution de la 
croissance des bacteries n'a ete observee par rapport au vecteur controle 
pBeloBacll sans insert. 
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• Verification de la taille des inserts de la banque de B AC 

Les ADN plasmidiques de 40 clones ont ete analyses par digestion 
enzymatique. Les tallies des inserts se trouvent toutes entre 20 et 30 Kb (comme 
decrit dans les conditions optimum de la creation de la banque rTgV). 

• Construction du vecteur de ciblage 

Dans ces 40 clones, un mini-Bac contenant un insert de 20 kb a ete choisi. 
Un gene de selection a ete introduit par digestion enzymatique et religation. Le petit 
d'homologie (1,4 Kb pour le temoin positif, 1,1Kb pour le vecteur de RH) et le 
grand bras d'homologie (9Kb) ont ete obtenus par action de l'exonuclease III (voir 
protocole dans Sambrook et al, Chapitre 5). Un vecteur dit temoin positif et un 
vecteur de recombinaison homologue ont ainsi ete construits. Un simple sequensage 
(de deux fois 500 pb) a suffi pour elaborer le criblage de Tevenement de 
recombinaison homologue. 

• Electroporation et recombinaison homologue en cellule ES 

Cette etape est realisee selon des methodes connues dans Tart. Le taux de 
recombinaison homologue en cellule ES depend des sequences d'homologie du 
vecteur de recombinaison homologue et non de son mode d' elaboration. 
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Revendications 



1. Vecteur de clonage adapte pour la creation d'une banque d'ADN genornique, 
caracterise en ce qu'il presente une cassette comprenant 

5 - un polylinker permettant P integration d'un fragment d'ADN genomique, 

ledit polylinker etant flanque de sites rares de restriction 
et que ladite cassette est flanquee de sites tres rares de restrictions. 

2. Vecteur selon la revendication 1, caracterise en ce que ladite cassette comprend 
egalement au moins un gene de selection negative. 

10 3. Vecteur selon la revendication 1 ou 2, caracterise en ce ledit polylinker 
permettant Pintegration d'un fragment d'ADN genomique presente un 
maximum de 4 sites de restrictions. 

4. Vecteur selon Pune des revendications 1 a 3, caracterise en ce qu'il est derive 
d'un cosmide, ou d'un vecteur de chromosome artificiel, de preference de 

15 bacterie. 

5. Vecteur selon la revendication 4, caracterise en ce qu'il est derive du vecteur 
pBeloBACIL 

6. Vecteur selon la revendication 4 ou 5, caracterise en ce qu'au moins un site de 
restriction choisi parmi les sites presents 1, 2 ou 3 fois dans le squelette du 

20 vecteur parent en est absent. 

7. Vecteur selon Pune des revendications 5 ou 6, caracterise en ce que son 
squelette ne presente plus au moins un site choisi parmi Apal, BstER, SacIL, Sfil, 
Spel, SphI, StuI, Xho\ BssHIL, EcoRl, EcoRV, Kpnl, Ndel, NotI, Nrul, Pvul, 
SgrAl, Xbal, Pstl, Sail et Smal. 

25 8. Vecteur selon la revendication 7, caracterise en ce que son squelette ne presente 
plus de site BstER. 

9. Vecteur selon Pune des revendications 1 a 8, caracterise en ce que ladite 
cassette presente un site tres rare de restriction a Pune des ses extremites et deux 
sites tres rares de restriction a P autre extremite, Pun de ces deux sites etant 

30 identique au site situe a Pautre extremite de la cassette. 

10. Vecteur selon Pune des revendications 1 a 9, caracterise en ce que ledit 
polylinker est flanque de plusieurs (nombre superieur a 3) sites rares de 
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restrictions choisis notamment parmi Pmel> SgrAI, RsrII, CM, Noil, Pad, Srfl, 
Nhel. 

11. Vecteur de clonage selon Tune des revendications 2 a 10, caracterise en ce que 
ladite cassette comprend deux copies du meme gene de selection negative, 

5 flanquant ledit polylinker et sites rares de restriction, 

12. Vecteur selon Tune des revendications 1 a 11, caracterise en ce qu'il s'agit du 
vecteur de sequence SEQ ID N° L 

13. Procede pour effectuer une recombinaison ciblee dans un organisme, a partir 
d'une banque d' ADN genomique dans un vecteur selon Tune des revendications 

10 1 a 12 comprenant : 

a) Pincubation d'un vecteur de ladite banque genomique avec au moins un 
fragment d'ADN comprenant au moins un transposon, ledit transposon 
comprenant 

un gene de selection positive, 
15 - eventuellement un gene de selection negative et/ou un gene 

marqueur, 

lesdits genes de selection etant eventuellement encadres par les sites 
d'action I d'une recombinase site-specifique I, 

et de fa?on optionnelle au moins un site d'action II d'une 
20 recombinase site-specifique II differente de la premiere recombinase 

I, 

ledit site d'action II n' etant pas situe entre lesdits sites d'action I de la 
premiere recombinase I, 

en presence d'une enzyme ayant une activite de transposase pour 
25 le(s)dit(s) transposon(s), de telle sorte que le(s)dit(s) transposon(s) est 

(sont) transfere(s) dans ledit fragment genomique, 

b) l'introduction dudit vecteur, eventuellement linearise, portant ledit 
fragment genomique dans lequel est (sont) insere(s) le(s)dit(s) 
transposons dans une cellule hote cible issue dudit organisme, 

30 c) la selection des evenements de recombinaison homologue dans ladite 

cellule cible par l'utilisation du (des) gene(s) de selection positive 
porte(s) par le(s)dit(s) transposon(s), et eventuellement du gene de 
selection negative porte par ledit vecteur de clonage. 
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14. Procede selon la revendication 13, caracterise en ce que l'etape c) est suivie 
d'une etape d) : 

d) la soumission des cellules transformees par recombinaison homologue et 
selectionnees dans Petape c) a Paction de la recombinase I, afin 
5 d'eliminer le(s) gene(s) de selection positive et eventuellement negative 

porte(s) par le(s) transposon(s). 

15. Procede selon la revendication 13 ou 14, caracterise en ce que Porganisme cible 
est un organisme pluricellulaire, et que ladite cellule cible issue dudit organisme 
est une cellule souche. 

10 16. Procede selon la revendication 15, caracterise en ce que ledit organisme 
appartient au genre des rongeurs, notamment a Pespece murine. 

17. Procede selon Tune des revendications 13 a 16, caracterise en ce que Ton induit 
la deletion d'un fragment genomique dans ledit organisme apres Tetape c) ou 
eventuellement Fetape d) par la mise en contact des cellules selectionnees dans 

1 5 l'etape c) ou derivees desdites cellules avec la recombinase n. 

18. Kit comprenant : 

un vecteur de clonage selon Tune des revendications 1 a 12, 

au moins un fragment d' ADN comprenant au moins un transposon, ledit 

transposon comprenant un gene de selection positive, eventuellement un 

20 gene de selection negative et/ou un gene marqueur, eventuellement 

encadres par les sites d 5 action I d'une recombinase site-specifique I, 
optionnellement au moins un site d'action II d'une recombinase site- 
specifique II differente de la premiere recombinase I, ledit site d' action 
II n'etant pas situe entre lesdits sites d' action I de la premiere 

25 recombinase I. 

19. Kit selon la revendication 18, caracterise en ce qu'il comprenant un ou deux 
fragments d'ADN, chacun comprenant un transposon, chaque transposon 
portant un gene de selection positive different, et eventuellement un gene de 
selection negative, de preference identique pour les deux transposons, lesdits 

30 genes de selection positive et negative etant encadres par les sites d'action d'une 
recombinase I. 
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20. Kit selon la revendication 19, caracterise en ce que chaque transposon comprend 
une sequence correspondant a un site d'action d'une recombinase II differente 
de la premiere recombinase I. 

21. Kit selon Pune des revendications 18 a 20, caracterise en ce que ladite 
5 recombinase I est la recombinase FLP, ladite recombinase II etant la 

recombinase Cre. 

22. Kit selon Tune des revendications 18 a 21 , caracterise en ce qu'il comprend une 
enzyme ayant une activite de transposase pour le(s)dit(s) transposon(s). 

23. Kit selon Tune des revendications 18 a 22 pour la mise en oeuvre d'un procede 
1 0 selon Tune des revendications 13 a 17. 

24. Banque d'ADN genomique, caracterisee en ce que les fragments d'ADN 
genomique sont clones dans un vecteur selon Time des revendications 1 a 12. 
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LISTE DE SEQUENCES 

<110> GENOWAY 

<120> VECTEURS DE CLONAGE POUR RECOMBINAISON HOMOLOGUE ET 
PROCEDE LES UTILISANT 

<130> D19317 

<150> FR 01/06921 
<151> 2001-05-28 

<160> 4 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 13478 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Vecteur 
rTgV, 13478 bp, circulaire 

<400> 1 

ctcgaccaat tctcatgttt gacagcttat catcgaattt ctgccattca tccgcttatt 60 
atcacttatt caggcgtagc aaccaggcgt ttaagggcac caataactgc cttaaaaaaa 120 
ttacgccccg ccctgccact catcgcagrta ctgttgtaat tcattaagca ttctgccgac 180 
atggaagcca tcacaaacgg catgatgaac ctgaatcgcc agcggcatca gcaccttgtc 24 0 
gccttgcgta taatatttgc ccatggtgaa aacgggggcg aagaagttgt ccatattggc 300 
cacgtttaaa tcaaaactgg tgaaactcac ccagggattg gctgagacga aaaacatatt 360 
ctcaataaac cctttaggga aataggccag gttttcaccg taacacgcca catcttgcga 420 
atatatgtgt agaaactgcc ggaaatcgtc gtggtattca ctccagagcg atgaaaacgt 480 
ttcagtttgc tcatggaaaa cggtgtaaca agggtgaaca ctatcccata tcaccagctc 540 
accgtctttc attgccatac ggaattccgg atgagcattc atcaggcggg caagaatgtg 600 
aataaaggcc ggataaaact tgtgcttatt tttctttacg gtctttaaaa aggccgtaat 660 
atccagctga acggtctggt tataggtaca ttgagcaact gactgaaatg cctcaaaatg 720 
ttctttacga tgccattggg atatatcaac ggtggtatat ccagtgattt ttttctccat 780 
tttagcttcc ttagctcctg aaaatctcga taactcaaaa aatacgcccg gtagtgatct 840 
tatttcatta tggtgaaagt tggaacctct tacgtgccga tcaacgtctc attttcgcca 900 
aaagttggcc cagggcttcc cggtatcaac agggacacca ggatttattt attctgcgaa 960 
gtgatcttcc gtcacaggta tttattcgcg ataagctcat ggagcggcgt aaccgtcgca 1020 
caggaaggac agagaaagcg cggatctggg aagtgacgga cagaacggtc aggacctgga 1080 
ttggggaggc ggttgccgcc gctgctgctg acggtgtgac gttctctgtt ccggtcacac 1140 
cacatacgtt ccgccattcc tatgcgatgc acatgctgta tgccggtata ccgctgaaag 1200 
ttctgcaaag cctgatggga cataagtcca tcagttcaac ggaagtctac acgaaggttt 1260 
ttgcgctgga tgtggctgcc cggcaccggg tgcagtttgc gatgccggag tctgatgcgg 1320 
ttgcgatgct gaaacaatta tcctgagaat aaatgccttg gcctttatat ggaaatgtgg 1380 
aactgagtgg atatgctgtt tttgtctgtt aaacagagaa gctggctgtt atccactgag 1440 
aagcgaacga aacagtcggg aaaatctccc attatcgtag agatccgcat tattaatctc 1500 
aggagcctgt gtagcgttta taggaagtag tgttctgtca tgatgcctgc aagcggtaac 1560 
gaaaacgatt tgaatatgcc ttcaggaaca atagaaatct tcgtgcggtg ttacgttgaa 1620 
gtggagcgga ttatgtcagc aatggacaga acaacctaat gaacacagaa ccatgatgtg 1680 
gtctgtcctt ttacagccag tagtgctcgc cgcagtcgag cgacagggcg aagccctcga 1740 
gtgagcgagg aagcaccagg gaacagcact tatatattct gcttacacac gatgcctgaa 1800 
aaaacttccc ttggggttat ccacttatcc acggggatat ttttataatt atttttttta 1860 
tagtttttag atcttctttt ttagagcgcc ttgtaggcct ttatccatgc tggttctaga 1920 
gaaggtgttg tgacaaattg ccctttcagt gtgacaaatc accctcaaat gacagtcctg 1980 
tctgtgacaa attgccctta accctgtgac aaattgccct cagaagaagc tgttttttca 2040 
caaagttatc cctgcttatt gactcttttt tatttagtgt gacaatctaa aaacttgtca 2100 
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cacttcacat ggatctgtca tggcggaaac agcggttatc aatcacaaga aacgtaaaaa 2160 
tagcccgcga atcgtccagt caaacgacct cactgaggcg gcatatagtc tctcccggga 2220 
tcaaaaacgt atgctgtatc tgttcgttga ccagatcaga aaatctgatg gcaccctaca 2280 
ggaacatgac ggtatctgcg agatccatgt tgctaaatat gctgaaatat tcggattgac 234 0 
ctctgcggaa gccagtaagg atatacggca ggcattgaag agtttcgcgg ggaaggaagt 2400 
ggttttttat cgccctgaag aggatgccgg cgatgaaaaa ggctatgaat cttttccttg 24 60 
gtttatcaaa cgtgcgcaca gtccatccag agggctttac agtgtacata tcaacccata 2520 
tctcattccc ttctttatcg ggttacagaa ccggtttacg cagtttcggc ttagtgaaac 2580 
aaaagaaatc accaatccgt atgccatgcg tttatacgaa tccctgtgtc agtatcgtaa 2640 
gccggatggc tcaggcatcg tctctctgaa aatcgactgg atcatagagc gttaccagct 2700 
gcctcaaagt taccagcgta tgcctgactt ccgccgccgc ttcctgcagg tctgtgttaa 27 60 
tgagatcaac agcagaactc caatgcgcct ctcatacatt gagaaaaaga aaggccgcca 2820 
gacgactcat atcgtatttt ccttccgcga tatcacttcc atgacgacag gatagtctga 2880 
gggttatctg tcacagattt gagggtggtt cgtcacattt gttctgacct actgagggta 2940 
atttgtcaca gttttgctgt ttccttcagc ctgcatggat tttctcatac tttttgaact 3000 
gtaattttta aggaagccaa atttgagggc agtttgtcac agttgatttc cttctctttc 3060 
ccttcgtcat gtgacctgat atcgggggtt agttcgtcat cattgatgag ggttgattat 3120 
cacagtttat tactctgaat tggctatccg cgtgtgtacc tctacctgga gtttttccca 3180 
cggtggatat ttcttcttgc gctgagcgta agagctatct gacagaacag ttcttctttg 3240 
cttcctcgcc agttcgctcg ctatgctcgg ttacacggct gcggcgagcg ctagtgataa 3300 
taagtgactg aggtatgtgc tcttcttatc tccttttgta gtgttgctct tattttaaac 3360 
aactttgcgg ttttttgatg actttgcgat tttgttgttg ctttgcagta aattgcaaga 3420 
tttaataaaa aaacgcaaag caatgattaa aggatgttca gaatgaaact catggaaaca 3480 
cttaaccagt gcataaacgc tggtcatgaa atgacgaagg ctatcgccat tgcacagttt 3540 
aatgatgaca gcccggaagc gaggaaaata acccggcgct ggagaatagg tgaagcagcg 3600 
gatttagttg gggtttcttc tcaggctatc agagatgccg agaaagcagg gcgactaccg 3660 
cacccggata tggaaattcg aggacgggtt gagcaacgtg ttggttatac aattgaacaa 3720 
attaatcata tgcgtgatgt gtttggtacg cgattgcgac gtgctgaaga cgtatttcca 3780 
ccggtgatcg gggttgctgc ccataaaggt ggcgtttaca aaacctcagt ttctgttcat 384 0 
cttgctcagg atctggctct gaaggggcta cgtgttttgc tcgtggaagg taacgacccc 3900 
cagggaacag cctcaatgta tcacggatgg gtaccagatc ttcatattca tgcagaagac 3960 
actctcctgc ctttctatct tggggaaaag gacgatgtca cttatgcaat aaagcccact 4020 
tgctggccgg ggcttgacat tattccttcc tgtctggctc tgcaccgtat tgaaactgag 4 080 
ttaatgggca aatttgatga aggtaaactg cccaccgatc cacacctgat gctccgactg 4140 
gccattgaaa ctgttgctca tgactatgat gtcatagtta t-tgacagcgc gcctaacctg 4200 
ggtatcggca cgattaatgt cgtatgtgct gctgatgtgc tgattgttcc cacgcctgct 4260 
gagttgtttg actacacctc cgcactgcag tttttcgata tgcttcgtga tctgctcaag 4320 
aacgttgatc ttaaagggtt cgagcctgat gtacgtattt tgcttaccaa atacagcaat 4380 
agtaatggct ctcagtcccc gtggatggag gagcaaattc gggatgcctg gggaagcatg 4440 
gttctaaaaa atgttgtacg tgaaacggat gaagttggta aaggtcagat ccggatgaga 4500 
actgtttttg aacaggccat tgatcaacgc tcttcaactg gtgcctggag aaatgctctt 4560 
tctatttggg aacctgtctg caatgaaatt ttcgatcgtc tgattaaacc acgctgggag 4 620 
attagataat gaagcgtgcg cctgttattc caaaacatac gctcaatact caaccggttg 4 680 
aagatacttc gttatcgaca ccagctgccc cgatggtgga ttcgttaatt gcgcgcgtag 4740 
gagtaatggc tcgcggtaat gccattactt tgcctgtatg tggtcgggat gtgaagttta 4800 
ctcttgaagt gctccggggt gatagtgttg agaagacctc tcgggtatgg tcaggtaatg 48 60 
aacgtgacca ggagctgctt actgaggacg cactggatga tctcatccct tcttttctac 4 920 
tgactggtca acagacaccg gcgttcggtc gaagagtatc tggtgtcata gaaattgccg 4 98 0 
atgggagtcg ccgtcgtaaa gctgctgcac ttaccgaaag tgattatcgt gttctggttg 504 0 
gcgagctgga tgatgagcag atggctgcat tatccagatt gggtaacgat tatcgcccaa 5100 
caagtgctta tgaacgtggt cagcgttatg caagccgatt gcagaatgaa tttgctggaa 5160 
atatttctgc gctggctgat gcggaaaata tttcacgtaa gattattacc cgctgtatca 5220 
acaccgccaa attgcctaaa tcagttgttg ctcttttttc tcaccccggt gaactatctg 5280 
cccggtcagg tgatgcactt caaaaagcct ttacagataa agaggaatta cttaagcagc 534 0 
aggcatctaa ccttcatgag cagaaaaaag ctggggtgat atttgaagct gaagaagtta 5400 
tcactctttt aacttctgrtg cttaaaacgt catctgcatc aagaactagt ttaagctcac 54 60 
gacatcagtt tgctcctgga gcgacagtat tgtataaggg cgataaaatg gtgcttaacc 5520 
tggacaggtc tcgtgttcca actgagtgta tagagaaaat tgaggccatt cttaaggaac 5580 
ttgaaaagcc agcaccctga tgcgaccacg ttttagtcta cgtttatctg tctttactta 5640 
atgtcctttg ttacaggcca gaaagcataa ctggcctgaa tattctctct gggcccactg 5700 
ttccacttgt atcgtcggtc tgataatcag actgggacca cggtcccact cgtatcgtcg 5760 
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gtctgattat tagtctggga ccacggtccc actcgtatcg tcggtctgat tattagtctg 5820 
ggaccacggt cccactcgta tcgtcggtct gataatcaga ctgggaccac ggtcccactc 5880 
gtatcgtcgg tctgattatt agtctgggac catggtccca ctcgtatcgt cggtctgatt 5940 
attagtctgg gaccacggtc ccactcgtat cgtcggtctg attattagtc tggaaccacg 6000 
gtcccactcg tatcgtcggt ctgattatta gtctgggacc acggtcccac tcgtatcgtc 6060 
ggtctgatta ttagtctggg accacgatcc cactcgtgtt gtcggtctga ttatcggtct 6120 
gggaccacgg tcccacttgt attgtcgatc agactatcag cgtgagacta cgattccatc 6180 
aatgcctgtc aagggcaagt attgacatgt cgtcgtaacc tgtagaacgg agtaacctcg 6240 
gtgtgcggtt gtatgcctgc tgtggattgc tgctgtgtcc tgcttatcca caacattttg 6300 
cgcacggtta tgtggacaaa atacctggtt acgttaccca ggccgtgccg gcacgttaac 6360 
cgggctgcat ccgatgcaag tgtgtcgctg tcgagtaact ataacggtcc taaggtagcg 6420 
aggcgcgcca tttgggctcg acattgatta ttgactagtt attaatagta atcaattacg 64 80 
gggtcattag ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc 654 0 
ccgcctggct gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc 6600 
atagtaacgc caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact 6660 
gcccacttgg cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat 6720 
gacggtaaat ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact 6780 
tggcagtaca tctacgtatt agtcatcgct attaccatgg tcgaggtgag ccccacgttc 684 0 
tgcttcactc tccccatctc ccccccctcc ccacccccaa ttttgtattt atttattttt 6900 
taattatttt gtgcagcgat gggggcgggg gggggggggg cgcgcgccag gcggggcggg 6960 
gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg 7020 
cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg 7080 
aagcgcgcgg cgggcgggag tcgctgcgtt gccttcgccc cgtgccccgc tccgcgccgc 714 0 
ctcgcgccgc ccgccccggc tctgactgac cgcgttactc ccacaggtga gcgggcggga 7200 
cggcccttct cctccgggct gtaattagcg cttggtttaa tgacggctcg tttcttttct 72 60 
gtggctgcgt gaaagcctta aagggctccg ggagggccct ttgtgcgggg gggagcggct 7320 
cggggggtgc gtgcgtgtgt gtgtgcgtgg ggagcgccgc gtgcggcccg cgctgcccgg 7380 
cggctgtgag cgctgcgggc gcggcgcggg gctttgtgcg ctccgcgtgt gcgcgagggg 7440 
agcgcggccg ggggcggtgc cccgcggtgc gggggggctg cgaggggaac aaaggctgcg 7500 
tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcggcggtc gggctgtaac 75 60 
ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc 7620 
cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg 7680 
ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc 7740 
cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg 7800 
tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg 78 60 
cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa 7920 
atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct 7980 
cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc 8040 
ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt 8100 
ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa 8160 
ttcaccatgg accctgatga tgttgttgat tcttctaaat cttttgtgat ggaaaacttt 8220 
tcttcgtacc acgggactaa acctggttat gtagattcca ttcaaaaagg tatacaaaag 8280 
ccaaaatctg gtacacaagg aaattatgac gatgattgga aagggtttta tagtaccgac 8340 
aataaatacg acgctgcggg atactctgta gataatgaaa acccgctctc tggaaaagct 8400 
ggaggcgtgg tcaaagtgac gtatccagga ctgacgaagg ttctcgcact aaaagtggat 84 60 
aatgccgaaa ctattaagaa agagttaggt ttaagtctca ctgaaccgtt gatggagcaa 8520 
gtcggaacgg aagagtttat caaaaggttc ggtgatggtg cttcgcgtgt agtgctcagc 8580 
cttcccttcg ctgaggggag ttctagcgtt gaatatatta ataactggga acaggcgaaa 864 0 
gcgttaagcg tagaacttga gattaatttt gaaacccgtg gaaaacgtgg ccaagatgcg 8700 
atgtatgagt atatggctca agcctgtgca ggaaatcgtg tcaggcgatc tttgtgagaa 87 60 
ttcactcctc aggtgcaggc tgcctatcag aaggtggtgg ctggtgtggc caatgccctg 8820 
gctcacaaat accactgaga tctttttccc tctgccaaaa attatgggga catcatgaag 8880 
ccccttgagc atctgacttc tggctaataa aggaaattta ttttcattgc aatagtgtgt 894 0 
tggaattttt. tgtgtctctc actcggaagg acatatggga gggcaaatca tttaaaacat 9000 
cagaatgagt atttggttta gagtttggca acatatgccc atatgctggc tgccatgaac 9060 
aaaggttggc tataaagagg tcatcagtat atgaaacagc cccctgctgt ccattcctta 9120 
ttccatagaa aagccttgac ttgaggttag atttttttta tattttgttt tgtgttattt 9180 
ttttctttaa catccctaaa attttcctta catgttttac tagccagatt tttcctcctc 9240 
tcctgactac tcccagtcat agctgtccct cttctcttat ggagatccct cgacctgcag 9300 
cacaagctcc ctcgagggag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 9360 
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 9420 
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ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 9480 
tcgggaaacc tgtcgtgcca gcggatcgat ccgcatctca attagtcagc aaccatagtc 954 0 
ccgcccctaa ctccgcccat cccgccccta actccgccca gttccgccca ttctccgccc 9600 
catggctgac taattttttt tatttatgca gaggccgagg ccgcctcggc ctctgagcta 9660 
ttccagaagt agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctaacttgt 9720 
ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 9780 
catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 984 0 
tctggatctg tcgagggccg gccgagctca tgcattgcgg ccgcgtttaa acatttaaat 9900 
gtaatacgac tcactatagg gcgaggatcc aagcttagta ttctatagtg tcacctaaat 9960 
cgtatgtcga ccggaccggc ccgggcgcat gcttaattaa tggcaaacag ctattatggg 10020 
tattatgggt ctcgacattg attattgact agttattaat agtaatcaat tacggggtca 10080 
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 10140 
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 10200 
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 10260 
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 10320 
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 10380 
tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc 10440 
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 10500 
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 10560 
cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 10620 
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 10680 
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 10740 
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 10800 
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 10860 
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 10920 
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg 10980 
tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg 11040 
gccgggggcg gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg 11100 
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc 11160 
ctgcaccccc ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtacg 11220 
gggcgtggcg cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc 11280 
ggggcggggc cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc 11340 
gccggcggct gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag 114 00 
agggcgcagg gacttccttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc 114 60 
cgcaccccct ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc 11520 
ggggagggcc ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc 11580 
tgtccgcggg gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg 11640 
cgtgtgaccg gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta 11700 
cagctcctgg gcaacgtgct ggttattgtg ctgtctcatc attttggcaa agaattcacc 11760 
atggaccctg atgatgttgt tgattcttct aaatcttttg tgatggaaaa cttttcttcg 11820 
taccacggga ctaaacctgg ttatgtagat tccattcaaa aaggtataca aaagccaaaa 11880 
tctggtacac aaggaaatta tgacgatgat tggaaagggt tttatagtac cgacaataaa 11940 
tacgacgctg cgggatactc tgtagataat gaaaacccgc tctctggaaa agctggaggc 12000 
gtggtcaaag tgacgtatcc aggactgacg aaggttctcg cactaaaagt ggataatgcc 12060 
gaaactatta agaaagagtt aggtttaagt ctcactgaac cgttgatgga gcaagtcgga 12120 
acggaagagt ttatcaaaag gttcggtgat ggtgcttcgc gtgtagtgct cagccttccc 12180 
ttcgctgagg ggagttctag cgttgaatat attaataact gggaacaggc gaaagcgtta 12240 
agcgtagaac ttgagattaa ttttgaaacc cgtggaaaac gtggccaaga tgcgatgtat 12300 
gagtatatgg ctcaagcctg tgcaggaaat cgtgtcaggc gatctttgtg agaattcact 12360 
cctcaggtgc aggctgccta tcagaaggtg gtggctggtg tggccaatgc cctggctcac 12420 
aaataccact gagatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt 124 80 
gagcatctga cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat 12540 
tttttgtgtc tctcactcgg aaggacatat gggagggcaa atcatttaaa acatcagaat 12600 
gagtatttgg tttagagttt ggcaacatat gcccatatgc tggctgccat gaacaaaggt 12660 
tggctataaa gaggtcatca gtatatgaaa cagccccctg ctgtccattc cttattccat 12720 
agaaaagcct tgacttgagg ttagattttt tttatatttt gttttgtgtt atttttttct 12780 
ttaacatccc taaaattttc cttacatgtt ttactagcca gatttttcct cctctcctga 12840 
ctactcccag tcatagctgt ccctcttctc ttatggagat ccctcgacct gcagcacaag 12900 
ctccctcgag ggagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 12960 
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 13020 
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 13080 
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aacctgtcgt gccagcggat cgatccgcat ctcaattagt cagcaaccat agtcccgccc 1314 0 

ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc gccccatggc 13200 

tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga gctattccag 13260 

aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctaac ttgtttattg 13320 

cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 13380 

tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgga 134 4 0 

tcaaatctcg actcgctacc ttaggaccgt tatagtta " 13478 



<210> 2 
<211> 84 
<212> ADisI 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : Sequence 
contenant des sites de restrictions 

<400> 2 

ctcgagtaac tataacggtc ctaaggtagc gaggcgcgcc atcgatgtcg actcgctacc 60 
ttaggaccgt tatagttact cgag 84 



<210> 3 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Sequence 
contenant des sites de restrictions 

<400> 3 

ggcgcgccat ttaaatctcg ag 22 

<210> 4 
<211> 186 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Sequence 
contenant des sites de restrictions 

<400> 4 

tcgagggccg gccgagctca tgcattgcgg ccgcgtttaa acatttaaat gtaatacgac €0 

tcactatagg gcgaggatcc aagcttagta ttctatagtg tcacctaaat cgtatgtcga 120 

ccggaccggc ccgggcgcat gcttaattaa tggcaaacag ctattatggg tattatgggt 180 
ctcgag 186 
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